Материалы по тегу: блок питания

04.08.2025 [14:17], Владимир Мироненко

Суперускоритель с «батарейкой» — NVIDIA GB300 NVL72 получили особые блоки питания для сглаживания энергопотребления

NVIDIA представила решение для платформы GB300 NVL72, которое позволяет смягчать колебания напряжения, вызванные синхронной работой тысяч ускорителей (GPU) при работе ИИ-систем, и снижать пиковую нагрузку на сеть до 30 %. Подобные колебания крайне негативно влияют на энергосеть и других потребителей. Новое решение NVIDIA также будет использоваться в системах GB200 NVL72.

В процессе обучения ИИ-моделей тысячи ускорителей работают синхронно и выполняют одни и те же вычисления с разными данными. Эта синхронизация приводит к колебаниям мощности на уровне сети — падению напряжения или появлению излишков энергии при внезапных простоях, в отличие от традиционных рабочих нагрузок ЦОД, где ускорители работают асинхронно и некоррелированные задачи «сглаживают» нагрузку. Meta даже пришлось в качестве временной меры добавить в PyTorch опцию PYTORCH_NO_POWERPLANT_BLOWUP, которая загружает ускорители бессмысленной работой в моменты простоя.

Для решения этой проблемы компания оснастила NVIDIA GB300 блоком питания с конденсаторами, т.е. накопителями энергии, разработанными с привлечением компании LITEON Technology, а также необходимым аппаратным и программным обеспечением. На разных этапах работы системы используется несколько механизмов, включая ограничение мощности, накопление энергии и «сжигание» энергии — функция NVIDIA GPU Burn.

 Источник изображений: NVIDIA

Источник изображений: NVIDIA

Электролитические конденсаторы обеспечивают равномерное энергопотребление непосредственно в стойке. Они занимают почти половину объёма БП и обеспечивают накопление 65 джоулей энергии на каждый ускоритель. Накопитель (конденсатор) заряжается при низком потреблении энергии ускорителем и разряжается при высоком. Этот своего рода буфер помогает снизить колебания энергопотребления, что продемонстрировано в сравнительных тестах GB200 и GB300 при одинаковой нагрузке. GB300 снижает пиковую нагрузку на сеть на 30 %, обеспечивая при этом аналогичную мощность для ускорителей.

GB300 ограничивает скачки, пошагово увеличивая энергопотребление ускорителя. Ограничение по мощности увеличивается постепенно, в соответствии с возможностями сети. По завершении задания, программный драйвер, реализующий алгоритм сглаживания энергопотребления, активирует аппаратное снижение энергопотребления. Ускоритель продолжает потреблять постоянную мощность благодаря функции NVIDIA GPU Burn, ожидая возобновления нагрузки.

Если нагрузка не возобновляется, ускоритель плавно снижает энергопотребление. Если нагрузка на ускоритель возобновляется, функция NVIDIA GPU Burn мгновенно отключается. После завершения нагрузки ускоритель с помощью NVIDIA GPU Burn постепенно снижает энергопотребление со скоростью, соответствующей возможностям сети, а затем отключается.

Эти параметры контролируются такими настройками, как минимальное энергопотребление в режиме ожидания и время постепенного снижения нагрузки, которые можно настроить с помощью NVIDIA SMI или Redfish. Такой полный контроль энергопотребления снижает нагрузку на электросеть и делает планирование заданий более предсказуемым.

Как отметил ресурс The Futurum Group, благодаря предложенной NVIDIA схеме питания ЦОД больше не нужно строить с учётом пиковых потребностей в мощности. Вместо этого их можно масштабировать ближе к средним показателям использования, что означает возможность размещения большего количества оборудования в том же пространстве или снижение общих затрат на электроэнергию. Суперконденсаторы в качестве энергетического буфера для всего объекта целиком предлагает Siemens, хотя уже есть и более компактные решения размером со стойку.

Кроме того, поскольку сглаживание потребления мощности ограничено стойкой без её подачи обратно в сеть, операторы получают больше контроля над энергопотреблением. Такое сочетание аппаратного и программного обеспечения обеспечивает масштабируемость и делает ЦОД дружественными к энергосети, независимо от того, используют ли они системы GB200 или GB300 NVL72. Как отметил ресурс ServeTheHome, использование дополнительных аккумулирующих модулей в стойке, предложенное LITEON, также поможет более равномерному распределению нагрузки между крупными ИИ-кластерами.

Сантьяго Грихальва (Santiago Grijalva), профессор электротехники и вычислительной техники в Технологическом институте Джорджии, назвал новую технологию «довольно серьёзным событием», учитывая доминирующую роль NVIDIA в этой области. «Но это решение ограничено высококлассными системами NVIDIA, — указал он в электронном письме ресурсу Utility Dive. — Это решение конкурирует с решениями Tesla и аппаратными оптимизациями Meta, предлагая существенное, но не революционное усовершенствование существующих методов управления питанием».

Постоянный URL: http://servernews.kz/1127050
25.05.2024 [20:34], Сергей Карасёв

Infineon готовит блоки питания мощностью до 12 кВт для ИИ-серверов

Компания Infineon Technologies AG поделилась планами по выпуску блоков питания следующего поколения для серверов, ориентированных на выполнение ресурсоёмких задач ИИ и НРС в дата-центрах. Готовящиеся устройства обеспечат высокую мощность и улучшенную эффективность.

Infineon отмечает, что на фоне стремительного развития технологий ИИ возрастает энергетическая нагрузка в ЦОД. Современные ускорители на базе GPU обладают энергопотреблением до 1 кВт, а к концу текущего десятилетия этот показатель, как ожидается, достигнет 2 кВт и более. Это порождает необходимость в создании передовых блоков питания для серверного оборудования.

 Источник изображения: Infineon

Источник изображения: Infineon

На сегодняшний день в ассортименте Infineon присутствуют блоки питания мощностью 3 кВт и 3,3 кВт. К выпуску готовятся решения на 8 кВт и 12 кВт. Утверждается, что разработка новинок стала возможной благодаря интеграции трёх полупроводниковых материалов: кремния (Si), карбида кремния (SiC) и нитрида галлия (GaN). Такая комбинация, по заявлениям компании, позволяет добиться наилучших результатов с точки зрения производительности, эффективности и надёжности в высоконагруженных системах.

Инновационные блоки питания помогут снизить энергопотребление и выбросы CO2, что будет способствовать сокращению эксплуатационных расходов в течение срока службы. По утверждениям Infineon, устройства обеспечивают эффективность до 97,5 %. Удельная мощность увеличена до 100 Вт/дюйм3 по сравнению с 32 Вт/дюйм3 у доступного блока питания на 3 кВт. Это обеспечивает дополнительные преимущества в плане плотности компоновки и экономии средств.

Отмечается, что блок питания мощностью 8 кВт подходит для стоек с ИИ-оборудованием общей мощностью до 300 кВт. Это устройство станет доступно в I квартале 2025 года. О сроках начала продаж модели мощностью 12 кВт пока ничего не сообщается. При этом крупные операторы всё чаще предпочитают варианты с единой DC-шиной на уровне стойки.

Постоянный URL: http://servernews.kz/1105400

Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»;

Система Orphus